“数据科学”:一门跨学科领域,主要用统计学、计算机科学与领域知识来收集、清理、分析数据,并建立模型以发现规律、做预测或支持决策。(也常包含数据工程、机器学习与可视化等实践。)
/ˈdeɪtə ˈsaɪəns/ (亦常见 /ˈdætə ˈsaɪəns/)
Data science helps companies understand their customers.
数据科学帮助公司理解他们的客户。
With data science, researchers can combine large datasets and machine-learning models to predict disease outbreaks more accurately.
借助数据科学,研究人员可以整合海量数据集与机器学习模型,更准确地预测疾病暴发。
“Data”来自拉丁语 datum,意为“给出的东西”,在现代英语中逐渐转为“数据”的集合含义;“Science”源自拉丁语 scientia,意为“知识”。“Data science”作为术语在20世纪后期逐步流行,并在21世纪因大数据与机器学习的兴起而广泛使用,用来概括“从数据中获取知识与价值”的系统方法。